Andmekaeve tulemuste statistiline olulisus ja vahetustega randomiseerimine

نویسنده

  • Raivo Kolde
چکیده

Antud kokkuvõte on koostatud peamiselt artiklite Gionis et al. [2007] ja Hanhijärvi et al. [2009] põhjal ja käsitleb andmekaeve tulemuste huvitavuse või olulisuse hindamist. Andmekaeve ülesanne on otsida suurtest andmemassiividest kasulikku informatsiooni ja seoseid, mis võimaldaks uuritavatest andmetest paremini aru saada ja teha nende põhjal intelligentsemaid otsuseid. Üks võimalus taolist informatsiooni leida on otsida kombinatsioone elementidest, mis esineved tihti koos. Kuna erinevaid kombinatsioone on tihti väga suur hulk, siis on ülesanne arvutuslikult keerukas ja seetõttu on välja pakutud algoritme palju. Kuid ainult sagedaste hulkade leidmine ei vii meid enamasti lõppeesmärgini, milleks on kasuliku informatsiooni leidmine. Huvitavad ja kasulikud on tavaliselt tulemused mis on mingis mõttes üllatavad, informatsioon mida me enne analüüsi ei teadnud ja mis ei olnud oodatav. Näiteks, kui poest ostetakse palju koos piima ja leiba siis see seos ei pruugi olla huvitav, sest mõlemad on populaarsed kaubad. Samas tekiila ja sidruni tihe koosesinemine ostukorvis võib viidata mingile spetsiifilisele seosele kahe toote vahel, sest nende juhuslik kokkusattumine pole nii tõenäoline. Et filtreerida välja kõige huvitavamad tulemused, peaksime me neid võrdlema oodatud tulemustega juhusliku andmestiku korral. Matemaatilise statistika meetodid formaliseerivad toodud idee. Näitks kui me teame kui palju poest iga kaupa eraldi osteti, siis me saame välja arvutada kaupade koosesinemiste arvu jaotuse eeldusel, et neid kaupu pannakse

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

The in vitro Effect of Doxorubicine-G2-FA Treatment on Breast Cancer Copyright

BACKGROUND: To achieve delivery of a drug to tumors, folic acid (FA) was used as a targeting ligand to change nanocarriers. Since the folate receptor has more expression in several tumor types such as breast cancer....

متن کامل

بررسی ارزش غذایی سطوح مختلف علوفه سیب زمینی ترشی(Helianthus tuberosus)و یونجه با روش های برون تنی و درون تنی (گوسفند)

This research was conducted to study the nutritive value of Jerusalem artichoke (JA) as animal feed. The aerial part of the JA plant was harvested, at full bloom stage, and then chopped and dried. The chopped JA hay included 0.0, 10, 20, 30 and 40 % of alfalfa hay, used as experimental diets, and tested for in vitro digestibility. In a changeover experiment with Latin square based design the in...

متن کامل

Effect of jasmonic (JA) and salicylic acid (SA) on phytochemical properties of Salvia officinalis L.

Background & aim: Sage (Salvia officinalis L.) is a perennial medicinal herb which belongs to Lamiales order and Lamiaceae family. This plant has economical value for four years. Nowadays the use of plant growth regulators (PGR) has an important role for increasing the secondary metabolites in plants. Among PGRs Jasmonic (JA) and salicylic acid (SA) have many applications in medicinal ...

متن کامل

Effect of foliar application of Jasmonic Acid (JA) on essential oil yield and its compositions of Thymus daenensis Celak

Background & aim: Recent researches have been done on effects of plant growth regulators (PGR) on growth and production of different crops whose results indicate the effectiveness of most of these hormones on qualitative and quantitative growth of herbs. The application of regulators and inhibitors of growth on herbs may, in addition to growth, also lead to secondary metabolites stimulation. Ja...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2010